半年后，你还在用校准区间做判断吗

本页目录

有人说"这个没法量化"，你接了什么话

上一次有人当着你的面说"没法衡量"或"太主观了"，你说了什么？

如果你追问了——"你说的衡量具体指什么""你现在对它的不确定性范围有多大""知道答案对决策值多少钱"——说明衡量定义的重置已经在起作用。如果你和其他人一起点了头，话题跳到下一项，旧定义还在主导。

想想最近一次被要求估计某个不确定的东西——项目工期、市场规模、风险发生的概率。你给出的是一个具体数字，还是一个带置信水平的区间？

给区间意味着你同时表达了"最佳猜测"和"我有多不确定"。习惯性给单一数字，说明校准估计的思维还没落到动作里。

一个额外的检查：你给的区间后来和实际结果对过没有？对过几次？如果从来没对过，校准就没有反馈回路，精度无从提高。

回忆上一次团队决定收集数据的情景。是谁、用什么标准决定了测哪个变量？

如果依据是"领导觉得重要"或"这个数据容易拿"，信息价值分析没有在起作用。EVPI 做的事很简单：先算知道一个变量的真值能影响多大的决策，再决定花多少资源去测。如果从来没做过这个判断，测量优先级还在被直觉和便利性驱动。

更尖锐的版本：你有没有因为 EVPI 太低而主动否决过一个测量请求？

收集了数据，结果和你之前的判断明显不一致。你做了什么？

一种反应是怀疑数据——"样本太小""采集方式有问题""这次情况特殊"。另一种是扔掉旧判断，全盘接受新数据。贝叶斯更新和这两种都不一样：让新数据修正旧估计，而不是替代它。如果数据和先验矛盾，区间可能暂时变宽——这说明发现了之前没看到的不确定性来源。

检查一下：你上一次让数据改变了判断方向，是什么时候？

团队讨论一个不确定的变量时，对话朝哪个方向走？是"到底是多少"，还是"当前范围够不够区分两个决策选项"？

如果会议的终点总是"数据不够精确，再研究研究"，说明衡量的定义还停在等号——等于精确计数。范围估计只需要达到一个标准：能区分不同的决策选项。落在阈值一侧就够了。

不是"知道校准是什么"，是有没有人坐下来，花一两个小时做区间估计练习，然后对照答案检查自己的覆盖率。

如果上一次校准练习是半年前甚至更久，校准水平很可能已经退化了。尤其是换了业务领域之后，之前的校准不会自动迁移。一个团队如果只在培训时做过一次，之后再没有碰过，校准就只是一个"听说过"的概念，不是一个在用的工具。

不需要是完美的衡量方案。只要有一个之前被判定为"不可衡量"的东西，你用任何方式——分解、小样本观察、间接替代变量——缩小了它的不确定性范围，就算数。

如果有，回想一下起步那一刻：是什么让你决定"试试看"而不是继续跳过？如果没有，问自己一个问题：是工作里真的没遇到这种变量，还是遇到了但习惯性地跳过了？